OBJECTIF : Analyser la base de données
# Import des données
data <- readRDS("data/data1.rds") # base de données sur laquelle on va appliquer tous les changements
Broken_Devices_Data <- read.csv("data/Broken-Devices-Data1-xlsx.csv",row.names=1) # base de données initiale sur laquelle on pourra se référer pour voir si les chgts ont bien été appliqués
# nombre d'observations
nb_obs <- nrow(data) # 968
# nombre de variables
nb_var <- ncol(data) # 164
La question posée était : Quel est le système d’exploitation de ce smartphone ?
Les réponses possibles étaient :
Voici le pourcentage de réponses obtenues :
## OS Nb_personnes Pourcent
## 1 Android 32472 67.9
## 2 IOS (Apple) 14126 29.5
## 3 Je ne sais pas 636 1.3
## 4 Autre 596 1.2
La plupart des propriétaires de smartphone ont donc des androids (67% des personnes de la base).
Regardons maintenant le nombre de personnes rencontrant des dysfonctionnements pour chaque système d’exploitation :
## Sytèmes.d.exploitation Nb_personnes Nb_personnes_dys Pourcentage_dys
## 1 IOS (Apple) 14126 5967 42
## 2 Android 32472 13403 41
## 3 Autre 597 349 58
## 4 Je ne sais pas 637 170 27
Le diagramme à barres suivant permet de visualiser cette répartition :
Le graphe suivant nous apporte plus de détails :
Parmis ces différents états quelle est la part de dysfonctionnements ?
## État Nb_personnes Nb_personnes_dys Pourcentage_dys
## 1 Neuf 39257 15826 40
## 2 D'occasion 4348 2229 51
## 3 Reconditionné 4000 1739 43
## 4 Je ne sais pas 227 95 42
La part de dysfonctionnements pour les smarthpones d’occasion est assez importante (50%), suivie des smartphones reconditionnés avec une part de 45% de dysfonctionnements.
Parmis les smartphones d’occasion, quelle était leur durée d’utilisation avant que le propriétaire l’obtienne, et quel impact cela a eu sur le fait que le propriétaire rencontre des dysfonctionnements ou pas ?
Le graphe suivant nous donne plus de détails :
## Ancienne_duree_smart_occas Nb_personnes_dys Pourcent X2
## 1 Moins de 6 mois 400 18 2
## 2 Entre 6 mois et 1 an 433 19 2
## 3 Entre 1 et 2 ans 493 22 2
## 4 Entre 2 et 3 ans 306 14 2
## 5 Entre 3 et 5 ans 135 6 2
## 6 Plus de 5 ans 174 8 2
## 7 Je ne sais pas 288 13 2
Groupement plus fin par thématiques :
Les différentes catégories pourraient être :
Problèmes matériels : Problème avec l’écran, Problème de sensibilité du tactile, Problème avec l’appareil photo, Problème avec la lampe torche ou le flash, Problème avec le micro, Problème de son, Problème de prise jack, Problème de chargement, Problème de batterie, Problème de capteurs, Problème avec les boutons, Problème de vibreur
Problèmes de connectivité (ou de réseau) : Problème avec le GPS, Problème de Wi-Fi, Problème de Bluetooth ou de transferts de fichiers sans fil, Problème de téléphonie, Problème d’accès à Internet
Problèmes logiciels : Système d’exploitation non mis à jour, Applications ne pouvant pas être téléchargées ou mises à jour, Fonctionnalité qui ne marche plus, Dysfonctionnement logiciel, Problèmes avec des applications
Problèmes de performance : Problème de lenteur, Stockage saturé
Problèmes divers : Problème lié à une fonctionnalité manquante, Autre
Le tableau suivant donne le nombre de dysfonctionnements rencontrés pour chaque catégorie, et la part de chaque catégorie par rapport au nombre total de dysfonctionnements qui est de 832 :
## Dysfonctionnements Nb_dys Pourcentage_dys
## 1 Matériel 19585 2354
## 2 Logiciel 7741 930
## 3 Réseau 5878 706
## 4 Performance 8729 1049
## 5 Divers 1461 176
Le graphique à barres suivant permet de visualiser ces valeurs :
Parmis ces différentes catégories quels sont les types de gênes ressenties pour chacun des dysfonctionnements, le tableau suivant indique ces différents types de gênes ressenties pour chacunes des catégories en pourcentage :
## Dysfonctionnements Nb_dys Trés.gênant Plutôt.gênant Plutôt.pas.gênant
## 1 Matériel 19585 35 52 21
## 2 Logiciel 7741 24 42 16
## 3 Réseau 5878 38 52 16
## 4 Performance 8729 41 57 16
## 5 Divers 1461 12 46 35
## Pas.gênant.du.tout
## 1 4
## 2 2
## 3 2
## 4 0
## 5 12
Le graphique à barres suivant permet de visualiser cette répartion :
La gêne ressentie parmis tous les dysfonctionnements et ce peut importe la catégorie, est en grande marjorité “plutôt gênante”.
Quelle est la part de résolution des dysfonctionnments entre ces catégories ?
On remarque que dans chaque catégorie, les dysfonctionnements majoritaires sont ceux étant matériels, suivis de ceux étant liés à la performance. Les parts des différentes catégories semblent être assez égales entre chaque types de résolution.
Le tableau suivant donne plus de détails pour chaque types de résolution, avec une part en pourcentage pour cahque catégorie de dysfonctionnements, pour chaque type de résolution :
## Résolution Dys_Materiel
## 1 Oui et le problème est resolu 39
## 2 Oui mais le problème na pas pu être résolu 40
## 3 Non, le problème s’est résolu tout seul au bout d’un moment 34
## 4 Non, peut être plus tard 51
## 5 Non, je ne pense pas tenter de résoudre le problème 42
## Dys_Logiciel Dys_Reseau Dys_Performance Dys_Divers
## 1 18 18 21 4
## 2 18 14 26 1
## 3 29 17 17 3
## 4 14 11 22 2
## 5 20 12 21 4
Voici la répartition des temps de cohabitation pour les dysfonctionnements qui ont été résolus ou qui ont tenté d’être résolus :
Ce graphe nous montre que les problèmes de type matériel sont ceux qui ce règlent le plus vite.
Pour déterminer le temps de cohabitation avec les dysfonctionnements des individus n’ayant pas résolu pas le problème, il a fallu prendre le mois et l’année d’obtention de leur téléphone, puis pour chaque dysfonctionnement rencontré, le temps approximatif durant lequel il se rendu compte du problème, et déterminer le temps qui séparait ce temps approximatif du mois de novembre 2023 (date du questionnaire). Voici les temps de cohabitation pour les personnes n’ayant pas résolu les problèmes :
df <- data.frame(Cohabitation = Categorie, Nb_dys =round(don2[,1]), Pourcent=round(don2[,1]*100/sum(don2[,1])))
df
## Cohabitation Nb_dys Pourcent
## 1 Moins d'un mois 511 3
## 2 Entre 1 et 6 mois 2278 14
## 3 Entre 6 mois et 2 ans 6487 41
## 4 Plus de 2 ans 6587 42
Voici la même représentation mais avec la part de chaque catégorie de dysfonctionnements :
La grande part de problèmes avec lesquels les personnes cohabitent sont les problèmes matériels.
Voici une autre représentation mais sous forme de nuage de points, afin de mieux voir la répartition des valeurs :
On remarque que le temps de cohabitation avec le problème, lorsqu’on ne l’a pas résolu est de deux ans en trés grande marjorité, suivi de entre 6 mois et 2 ans.
Il serait intéressant de savoir quel est le nombre de personnes ayant rencontré 1,2,3 ou plus de dysfonctionnements en fonction de l’année d’obtention de leur smartphone. On se concentre sur les 5 dernières années car c’est celles pour lesquelles le nombre de dysfonctionnements rencontrés est important. Le graphe suivant nous apporte plus de détails :
On observe que de 2018 à 2020, le nombre de dysfonctionnements rencontrés par individus est de 2 en général, et que vers 2021 il passe à 1 majoritairement.
Ce graphe présente le nombre de personnes ayant cohabité avec des problèmes, et le nombre de dysfonctionnements qu’ils rencontraients à ce moment là :
On remarque que ceux qui ont cohabité avec le(s) problème(s) peu de temps étaient ceux qui en rencontraient plusieurs en même temps.